最高法院关于“中国裁判文书网”访问缓慢故障频繁意见的答复
关于“中国裁判文书网”网站建设建议的答复
糖糖:
您好!
《关于“中国裁判文书网”网站建设的建议》来信收悉,感谢您对人民法院司法公开工作的关注和宝贵建议,我们专门对您信中反映内容进行了分析,现就相关问题回复如下:
问题一:网站运行速度慢,故障频繁,经常出现页面无法显示的问题,经多次刷新后才能显示,并且持续不了几分钟,反复出现无法显示的问题。建议对网站加强维护,提高网站运行效率。
答复:由于中国裁判文书网公开文书数量和影响力不断增加,访问用户数不断增长。同时,5月初以来,大量技术公司通过爬虫系统无限制并发访问非法获取裁判文书数据,造成网站负荷过大,大量正常用户请求堵塞,访问出现速度慢或部分页面无法显示等现象。为更好地确保正常用户访问性能,2018年7月,我们以验证码的方式上线系统软件防爬功能。由于网站访问策略变更,且调整优化未一步到位,确实降低了正常用户的访问体验。通过后台监测,八月中旬以来,中国裁判文书网访问速度基本正常,95%的首页响应速度基本保持在3秒以内,网站性能已恢复稳定。后续,我们将不定期更新防爬虫技术,加强网站维护,提高网站运行效率和稳定性。
问题二:登陆该网站经常出现“您的访问频次超出正常访问范围,为保障网站稳定运行,请输入验证码后继续查看”的提示,输入验证码后,每次都出现“验证码错误”的提示,无法正常浏览网页。针对这一问题,即使刚刚打开电脑,点击该网站也会提示访问频次超出正常访问范围,让人很难理解,同时对设置访问频次提出质疑,既然是信息公开为什么要设置访问频次的限制;第二为什么输入验证码后,每次都会出现“验证码错误”的提示,仍然无法浏览网页。这一问题严重影响查询效率,希望取消访问频次的设置,及时消除网页故障,方便群众查询。
答复:验证码技术是防爬虫的一种有效措施,当浏览量在某段时间内达到一定数量后,将启用验证码机制进行核验。前期,因该验证码校验程序刚上线时不稳定,造成验证不通过偶有发生,此问题目前已解决。同时,由于互联网上出口IP共用现象较为突出,造成实际正常访问被错误识别为爬虫的“误防”现象时有发生。根据您所反馈的问题,目前我们已通过压缩单位时间长度、提高单位时间容量大幅提升用户并发量,减少“误防干扰”。
问题三:在查询相关信息的时候,没有以“公开时间”为检索条件的设置,造成查询不便。希望增设以“公开时间”为检索条件的设置,提高检索的查询效率。
答复:在中国裁判文书网的高级检索中,可以根据“裁判日期”进行检索。目前暂没有设置“公开时间”的检索条件,主要原因是爬虫系统会根据“公开时间”项进行增量文书爬取,待下一步防爬虫系统稳定、可靠运行一段时间后,我们将适时考虑增加“公开时间”检索项。
问题四:在浏览网页的时候,是可以选择每页显示信息数量的,分为“5,10,15,20”的选择项,但是大多数的时候选择大于5的选项后每页依然显示5条信息。并且在每页显示5条信息的情况下,当点击超过6-7页以后,相关信息开始不再更新,反复显示以前的信息。希望这一问题可以尽快解决,方便查询。
答复:由于前期爬虫行为过于猖獗,无限制暴力访问大幅降低正常用户访问性能,我们采取了通过限制列表页面翻页数量来防止爬虫系统的措施,用户如需浏览更多内容,可以通过设置组合检索条件,以提高检索精准度而获取相关文书内容。
问题五:该网站没有设置可选择页数的选项,比如我想浏览第10页的信息,只能从第1页开始逐页点击,直到第10页。建议设置这一选项,可以方便查找信息。
答复:目前已根据单次搜索显示容量优化完善了页面列表,每页显示20条记录,可以直接选择前20页中任意一页。
再次感谢您的宝贵建议,也期望在后续工作中得到您一如继往的支持。我们将广泛吸收各位网友的建议,做好中国裁判文书网的建设和运营工作,不断提升网站运行效率和使用体验。
最高人民法院
2019年2月19日